Análisis Exploratorio
A continuación se muestran análisis exploratorios de las variables que serán tomadas en el estudio.
Empresas
A continuación mostramos las clasificaciones de cada empresa censada.
En la pestaña identificadores se encuentran las descripciones de cada una de las variables. En caso de una revisión exhaustiva recomendamos ingresar al documento CIIU 2021 proporcionado por el DANE. Las utilizadas se encuentran desde la página 490.
| Identificador | Significado |
|---|---|
| 451 | Vehículos automotores |
| 453 | Partes, piezas y accesorios para vehículos automotores. |
| 454 | Mantenimiento y reparación de motocicletas y de sus partes, piezas y accesorios. |
| 462 | Al por mayor de materias primas agropecuarias o animales vivos. |
| 464 | Al por mayor de alimentos, bebidas y tabaco. |
| 465 | Al por mayor de maquinaria y equipo. |
| 466 | Al por mayor especializado de combustibles no convencionales, productos de construcción, químicos, metales y desperdicios. |
| 4711-472 | Al por menor en establecimientos no especializados (excepto 4719).) |
| 4719 | Al por menor de surtido en diferentes alimentos, bebidas alcohólicas y tabaco. |
| 473 | Al por menor de productos para automotores. |
| 4741-4742 | Al por menor de software y hardware de computadores y dispositivos audiovisuales. |
| 4752 | Al por menor de artículos de ferretería, pintura y productos de vidrio. |
| 4759-4761 | Al por menor de artículos domésticos de limpieza, papelería, cocina o emergencia. |
| 4771-4751 | Al por menor de ropa o textiles. |
| 4772 | Al por menor de calzado. |
| 4773 | Al por menor de productos farmacéuticos. |
Explicaciones mas precisas de cada identificador se encuentran en el documento CIIU 2021. Las utilizadas se encuentran desde la página 490.
Análisis Univariado
Variables Cualitativas
Nótese que parece haberse reducido la creación de empresa en los últimos 10 años.
Proponemos tambien hacer una clasificación de este tipo, pero en vez de intervalos de décadas, hacerla según mandatos presidenciales.
Clasificamos publicidad, basándonos en el porcentaje gastado respecto a la producción bruta.
Es este caso, basamos la clasificación del tamaño de cada empresa según el decreto presidencial 957 de 2019.
Nótese que la gran mayoría de empresas censadas (es decir, las conformantes del sector) son PYMEs.
Variables Cuantitativas
Todas las variables cuentan con un fuerte sesgo a izquierda. Por ello, aplicamos escala LOG.
Se conoce a las cotizaciones patronales como todos los aportes monetarios que deben ser realizados por parte de los empleadores a la seguridad social.
Análisis Bivariado
Todos los Análisis bivariados que cuenten con variables continuas serán realizados en base a la base logarítmica. Esto para facilitar la exposición de los datos.
Cuantitativas vs Cuantitativas
A continuación colocamos un plotpairs() de las cinco variables que más nos llamaron la atención para estudiar.

En la propia tabla se alcanza a apreciar que en general todas las variables cuentan con correlaciones notables. Así distintas variables, particularmente GASTOSNOP muestren una distribución bimodal. Esto ocurre debido a que varias empresas registraron con cero esta variable en particular.
Cuantitativas vs Cualitativas
La variable BRUTA nos pareció la variable más relevante de todas, dado a que esta es con la que se clasifica a las empresas según su tamaño. Veamos los siguientes boxplots:
Como vendría a suponerse, el tipo de comercio al que se dedique una empresa muestra estar correlacionado con su tamaño.

Se logra apreciar que existe una correlación muy ligera, casi despreciable, entre la edad de una empresa y su tamaño.

Se evidencia tambien que existe una correlacion, así sea ligera, entre el tamaño de la empresa y su gasto en publicadad. Hay que tomar en cuenta que esta clasificación según el gasto en publicidad se hace según el porcentaje de sus gastos respecto a su tamaño.

En este cuadro se muestra que existe una correlación entre tener mujeres propietarias o socias, con el tamaño de la empresa.


Discretas vs Discretas
En la siguiente figura comparamos la variable clasificación CIIU con las demás variables discretas.
En esta tabla se logran mostrar distintas distribuciones que tienen todas las variables respecto a la clasificación a la que pertenece cada empresa. De esta manera, se puede evidenciar que no todo el sector empresarial de colombia tiene comportamientos homogéneos respecto a, digamos, la edad de existencia de la empresa o gastos en publicidad.

